日前,清华大学药物研究所研究人员,以高效液相色谱指纹图谱为研究对象,对各种指纹图谱的相似度评价方法进行了比较。认为其实际应用中,应针对不同的实际问题,采用适合的相似度评价方法,以便更好地用于中药质量控制。
近年来,适合于从整体上分析复杂化学物质组成的稳定性的中药指纹图谱已成为国内外广泛接受的质量评价模式,同时也是中药质量评价研究领域的前沿课题。获取能够反映中药复杂化学成分特征的指纹图谱需要进行数据分析和处理。由于指纹图谱所反映的体系非常复杂,一般需采用模式识别方法进行研究和处理。对从整体上表现中药复杂体系所含化学成分的变化情况,指纹图谱的相似度评价起着非常关键的作用。根据文献报道,相似度的评价方法主要有峰重叠率法(Nei系数法)、相关系数法、距离系数法、向量夹角余弦法和峰重叠率与共有峰强度结合法(改进的Nei系数法)等方法。这些方法都有各自的特点和应用范围。实际应用中,针对实际问题如何选用合适的相似度评价方法是亟须解决的问题。为此,需要对现有的指纹图谱相似度评价方法进行综合比较和评价。
研究人员先通过理论分析,比较了各种相似度系数的计算方法。如距离系数法、夹角余弦法、相关系数法、Nei系数法、改进Nei系数法。然后采用数字模拟以及统计方法对各种方法的性能进行了综合评价。
评价指纹图谱的相似度方法可分成三种类型:采用差异评价指纹图谱的相似度,如距离系数法;通过图谱间的相似性评价相似度(如夹角余弦法,相关系数法和Nei系数法);在相似性的基础上引入差异来评价相似度(如改进的Nei系数法)。从相似度计算公式的比较可以看出,距离系数法、夹角余弦法、相关系数法和改进的Nei系数法能够对指纹图谱峰强度的变化进行评价,而Nei系数法只能从质的角度表征图谱的相似程度。距离系数法和改进的Nei系数法与指纹图谱数据的线性比例关系有关,而夹角余弦法、相关系数法和Nei系数法不受数据线性比例关系的影响。根据指纹图谱波动的影响可以看出,夹角余弦法随波动强度的变化较平稳,幅度较小,其次是相关系数。距离系数法和改进的Nei系数法的变化幅度较大,对波动变化表现的比较敏感。Nei系数值并不随波动强度的变化而变化,因它只与峰的数量有关,与峰的强度无关。
从峰的缺失的影响可以看出,各种相似度评价方法都能反映出峰的缺失对相似度的影响。Nei系数法和改进的Nei系数法对小峰的缺失比较敏感,而相关系数法和夹角余弦法对大峰的缺失较为灵敏。距离系数法在一定范围内无论是大峰还是小峰都表现出较高的敏感性。在药材加工和提取过程中,指纹图谱中大峰的缺失并不常见。而对于同属不同种的药材,大峰的差异是有可能的,此时采用相关系数法、夹角余弦法和距离系数法评价相似度较为适宜。
从数据标准化处理的影响可以看出,距离系数法、相关系数法、夹角余弦法和改进的Nei系数法都能够对指纹图谱峰强度的变化进行相似度评价,其中相关系数法和夹角余弦法对指纹图谱的波动变化不够敏感,而距离系数法和改进的Nei系数法比较灵敏。对于峰的缺失,Nei系数法和改进的Nei系数法较敏感于小峰的缺失,而相关系数法和夹角余弦法对大峰的缺失较为灵敏。距离系数法无论对大峰还是小峰在一定范围内都表现出较高的敏感性。数据标准化处理对距离系数法、相关系数法和夹角余弦法的相似度评价的大小(等级)顺序影响较小、比较适合于指纹图谱的模式识别研究。